categorical distribution(类别分布/分类分布):概率论与统计学中的一种离散概率分布,用于描述一次试验的结果落在若干个互斥类别中的哪一类。它通常由参数向量 (p=(p_1,\dots,p_K)) 表示,其中每个 (p_k\ge 0) 且 (\sum_k p_k=1)。
(也常被视为“多项分布在一次试验时的特例”;在机器学习里常用于多分类标签的建模。)
/ˌkætəˈɡɔːrɪkəl ˌdɪstrɪˈbjuːʃən/
A categorical distribution assigns a probability to each class.
类别分布会为每个类别分配一个概率。
In a multi-class classifier, the predicted label is often modeled as a draw from a categorical distribution whose parameters come from the softmax output.
在多分类器中,预测标签常被建模为从一个类别分布中抽取的结果,而该分布的参数来自 softmax 的输出。
categorical 来自 category(“类别”),根源可追溯到希腊语 katēgoria(“归类、陈述”);distribution 来自拉丁语 distributio(“分配、分布”)。合起来字面意思就是“按类别进行分配/分布”,与其统计含义(给每个类别分配概率)一致。